import pandas as pd

# 读取原始的train.csv文件
df = pd.read_csv('train.csv')

# 检查数据行数是否符合预期
if len(df) != 891:
    print(f"警告：原始数据包含{len(df)}条记录，而不是预期的891条")

# 分割数据：前800条作为训练集，后91条作为验证集
train_df = df[:800]  # 前800条数据
validation_df = df[800:]  # 从第800条开始的剩余数据（共91条）

# 保存为新的CSV文件
train_df.to_csv('train.csv', index=False)
validation_df.to_csv('validation.csv', index=False)

# 输出分割结果信息
print(f"训练集已保存，包含{len(train_df)}条数据")
print(f"验证集已保存，包含{len(validation_df)}条数据")